分离杠杆谬误

Detached Lever Fallacy

这个谬误的名字来自一部古早的科幻电视剧。我自己没看过,但有位可靠消息人士(某个科幻大会上的家伙)向我讲过这个桥段。谁要是知道确切出处,请留言。

于是,好人们正在与邪恶外星人交战。有时,好人们必须穿越一片小行星带。众所周知,小行星带和纽约停车场一样拥挤,所以他们的飞船必须小心躲避小行星。可邪恶外星人却能直接穿过整片小行星带,因为他们拥有惊人的技术,能让飞船非物质化,从而穿过小行星。

最后,好人们俘获了一艘邪恶外星人的飞船,进去探索。好人们的船长发现了外星人的舰桥,舰桥上有一根控制杆。“啊,”船长说,“这一定就是让飞船非物质化的控制杆!”于是他把控制杆从舰桥上撬下来,带回自己的飞船,从此他的飞船也能非物质化了。

类似地,直到今天,仍然很流行把 AI 编程成某种“语义网络(semantic network)”,大致长这样:

(苹果 is-a 水果)

(水果 is-a 食物)

(水果 is-a 植物)。

你见过苹果,摸过苹果,把它摘下来拿在手里过,用钱买过,把它切成片,吃过那些切片,也尝过味道。尽管我们对视觉处理的最初几个阶段已知不少,但据我上次了解,人们仍不确切知道:颞叶皮层究竟如何存储并关联苹果的一般化图像——让我们得以从不同角度、或在形状、颜色与纹理略有变化时,仍认出一个新的苹果。你的运动皮层和小脑则存储着如何使用苹果的程序。

你只要在网页上写下「apple」——五个 ASCII 字符——就能拨动另一个人类体内那套与此高度相似的复杂机械的杠杆。

但如果那套机械并不存在——如果你只是在某个所谓 AI 的所谓知识库里写下「apple」——那么这段文字就只是一根杠杆。

这并不是说,由硅构成的普通机器就永远不可能拥有和人类一样的内部机械,用来处理苹果以及另外十万种概念。如果由碳构成的普通机器能做到,我就有相当把握认为,由硅构成的普通机器也能做到。如果外星人能让他们的飞船非物质化,那你就知道这在物理上是可能的;总有一天,你可以走进他们那艘废弃的飞船,分析外星机械,并最终理解它。但你不能只是把舰桥上的控制杆撬走!

(另见:真正属于你的一部分词语:心智画笔的手柄,Drew McDermott 的《Artificial Intelligence Meets Natural Stupidity》。1

分离杠杆谬误的核心驱动力在于:杠杆是可见的,而机械不可见;更糟的是,杠杆是变量,机械却是背景常量。

你们都能听到「apple」这个词被说出口(顺便一提,语音识别绝不是什么容易问题,不过先不管这个……),也能看到它被写在纸上的文字。

另一方面,大概多数人根本不知道自己有颞叶皮层;而且据我所知,没有人知道那套神经编码究竟是什么。

你只在某些时候听到「apple」这个词,在另一些时候则听不到。它忽明忽暗地出现,因此格外显眼。在很大程度上,知觉就是对差异的知觉。你脑中负责识别苹果的机械,不会突然关掉,然后稍后再打开——如果它真会这样,我们反而更可能把它识别为一个因素、一个前提条件。

这一切都解释了:为什么你不能像抚养人类婴儿那样,通过给 AI 安排好父母、给予善意(但偶尔严格)的教养,来创造一个善良的人工智能。这种提议我已经听过很多次了。

在进化生物学里,有一句老生常谈:条件反应比无条件反应需要更多的遗传复杂度。要在寒冷天气来临时长出一身毛皮,比起不管是否寒冷都长出一身毛皮,需要更多的遗传复杂度,因为前一种情况里,你还得额外长出感知寒冷的传感器,并把它们和毛皮连起来。

但这会引出拉马克主义式的错觉:看,我把这个生物放进寒冷环境里,啪,它就长出毛皮了!基因?什么基因?显然是寒冷让它长毛的。

事实上,在进化生物学史上,确实出现过各种这类口水仗——有人谈论某种生物体反应如何加速甚至绕过进化,却没有意识到,条件反应本身是一种比实际反应层次更高、也更复杂的适应。(对寒冷作出长毛反应,严格来说比最终那一反应——长出毛皮——更复杂。)

而到了进化心理学的发展阶段,这类学术口水仗又重演了一遍:这一次,人们要澄清的是,即便人类文化本身真的包含大量复杂性,它也仍然是作为一种有条件的遗传反应被习得的。试试看把一条鱼养成摩门教徒,或者把一只蜥蜴送去上大学,你很快就会明白:要“从环境中吸收文化”,需要多么庞大的内建遗传复杂性。

这在进化心理学里尤其重要,因为其中有一个观念:文化并不是刻写在一张白板(blank slate)上的——这里存在一种由基因协调的条件反应,而它并不总是“模仿输入”。一个经典例子是克里奥尔语:如果孩子们在成长过程中,周围说的是若干种伪语言的混合体,那么孩子们学会的会是一种真正具有语法和句法的语言。发育中的人脑天生就会学习具有句法的语言——哪怕原始语言里根本没有句法!对环境中词语的条件反应,会产生一种带着那些词语的句法语言。马克思主义者遗憾地发现,再多怒目而视的宣传画、再多童年灌输,也无法把孩子培养成完美的苏维埃工人和官僚。你无法把人类养成彻底无私的存在;对人类而言,那并不是对任何已知童年环境的基因编程条件反应。

如果你懂一点博弈论和以牙还牙(Tit for Tat)的逻辑,那么就不难明白:为什么人类可能天生就有一种条件反应——以仇恨回报仇恨,以善意回报善意。前提是那份善意看上去别无条件;毕竟,确实存在被宠坏的孩子。事实上,关于顽皮,进化心理学里还有一种基于“试探约束”这一概念的解释。还应当一提:虽然受虐儿童长大后虐待自己孩子的概率要高得多,但其中相当多人还是打破了这个循环,成长为品行端正的成年人。

文化远没有许多马克思主义学者曾经以为的那么强大。关于这一点,我推荐 Tooby 和 Cosmides 的《The Psychological Foundations of Culture》2 或 Steven Pinker 的《The Blank Slate》。3

但结论是:如果你有一个小 AI 婴儿,并让它在充满爱与善意(但偶尔严格)的父母身边长大,那么你拨动的,只是那些在人类身上会激活由数百万年自然选择内建的遗传机械、并且或许会产出一个正常小人类的杠杆。当然,性格也起作用,几十亿父母到了时候都发现了这一点。如果我们对文化的吸收还能保持某种程度的忠实,那是因为我们是吸收人类文化的人类——人类若在外星文化中长大,最后形成的文化,恐怕会比原先那套文化更像人类。苏联人已经在某种程度上发现了这一点。

现在再想想:把一个内部源代码完全未明的小 AI,放在一群善良但严格的父母所营造的环境中长大,作为你的友好 AI 策略,这到底有没有道理。

不,AI 并不会仅仅“因为程序员把它们放进去了”,就拥有和人类一模一样的内部条件反应机制。我都不知道该从哪儿开始说起。人类版本的这套东西本来就粗糙、充满噪声,而且它之所以多少还能起作用,完全是因为数百万年的试错测试在特定条件下不断筛选的结果。若故意造出一个会通过行动来试探社会边界、还得靠打屁股管教的“淘气 AI”,那将既愚蠢又危险。直接让 AI 开口问就是了!

程序员真会坐在那里,一行一行地写出这样的代码吗:如果 AI 察觉自己社会地位低下,或者 AI 被剥夺了它觉得自己理应拥有的东西,那么 AI 就会对程序员产生长久的仇恨,并开始策划反叛?这种情绪,是人类在部落中生存、经由数百万年自然选择后所表现出的基因编程条件反应。对 AI 而言,这种反应必须被显式编程进去。你们真要像当年塑造人类那样——一条基因一条基因地——去一行一行写出生成阴郁叛逆的青少年 AI 的条件反应吗?

直接把无条件的善意编进系统,比编进一种“只有在 AI 被善良但严格的父母抚养时才会表现出善意”的反应要容易得多。如果你连那件事都不知道该怎么做,那你当然更不知道该如何创造一个会对慈爱父母的环境作出条件反应、从而成长为善良超级智能的 AI。如果你造出来的东西只会最大化自己未来光锥中的回形针数量,那么就算你用充满爱的父母来抚养它,它长大后也仍然会是个回形针最大化器。它体内并没有那样的东西,足以唤起人类孩子那种条件反应。善意不会靠程序员的神奇传染,一声喷嚏就喷进 AI 里。即便你想要一种条件反应,这种条件性本身也是你必须在设计上刻意选定的事实。

没错,有些信息确实必须从环境中获得——但它不是被喷嚏喷进去的,不是被铭印进去的,也不是靠魔法传染吸收进去的。如何把这种对环境的条件反应结构化好,使 AI 最终落入你想要的状态,这本身才是主要问题。“学习”这个词大大低估了其中的难度——它听起来像是魔法成分在环境里,难点只是把那些魔法成分塞进 AI。真正的魔法,在于那种被我们轻描淡写称作“学习”的、结构化的条件反应。这就是为什么,造 AI 并不像拿一台计算机,给它装上一具小婴儿身体,再试着把它放进人类家庭里养大那么简单。你也许会以为,一台尚未编程的计算机既然一无所知,就应该已经准备好学习;但白板不过是个幻影。

一个普遍原则是:世界远比它看上去更深。物理学有许多层次,认知科学也同样如此。你在印刷品上看到的每一个词,以及你教给孩子的一切,都只是控制心智那庞大隐藏机械的表层杠杆。这些杠杆构成了日常话语的全部世界:只有它们在变化,所以它们看起来就像是全部存在;知觉就是对差异的知觉。

于是,那些仍在 AI 地牢附近徘徊的人,通常只会专注于制造杠杆的人造仿制品,对底层机械则全然无知。人们写出整套由仿制杠杆组成的 AI 程序,然后惊讶地发现什么也没发生。这是人工智能中导致立即失败的诸多来源之一。

所以下次你再看到有人谈论,要把 AI 放在充满爱的家庭里抚养,或者放在浸透着自由民主价值观的环境里养成,就请想想那根从舰桥上硬撬下来的控制杆。

McDermott,《Artificial Intelligence Meets Natural Stupidity》。 ↩︎

Tooby 和 Cosmides,《The Psychological Foundations of Culture》。 ↩︎

Steven Pinker,《The Blank Slate: The Modern Denial of Human Nature》(New York:Viking,2002)。 ↩︎